Vers un modèle de langue mixte concepts-mots pour la recherche d'information
نویسندگان
چکیده
The majority of language models applied to information retrieval is based on word independence hypothesis. More precisely, those models are estimated without considering semantic or conceptual relations between those words. To palliate this problem, two principal approaches have been explored: the first one integrates syntactic dependencies between words (bi-grams, bi-terms) and the second approach is based on the use of semantic resources to integrate words dependencies. The language model proposed in this paper is in the second approach. We propose to relax the independence terms constraint by representing both documents and queries with concepts. MOTS-CLÉS : Recherche d’information, modèle de langue, concepts.
منابع مشابه
Modélisation de relations dans l'approche modèle de langue en recherche d'information
RÉSUMÉ. Nous abordons dans cet article le problème de la prise en compte de relations (par exemple de nature syntaxique ou sémantique) dans un modèle de langues en recherche d’information. En particulier, nous proposons, sur la base du modèle de langue, un cadre complet pour la prise en compte de relations, étiquetées ou non. Afin d’illustrer ce cadre, nous avons conduit une série d’expériences...
متن کاملExploitation des Liens Sémantiques pour l'Expansion de Requêtes dans un Système de Recherche d'Information
RÉSUMÉ: Dans cet article, nous proposons d’exploiter des liens sémantiques entre concepts pour améliorer la recherche d’information. Un thesaurus électronique de langue générale est utilisé pour la reformulation des requêtes utilisateurs en procédant par un processus d’"expansion prudente" en amont d’un moteur de recherche. Ce processus, transparent à l’utilisateur, exploite d’abord la notion d...
متن کاملModèle unifié pour la recherche d'information sémantique
Résumé : Un modèle documentaire permet de définir les unités d’indexation (mots, termes, etc.) et de les relier aux documents dans lesquels elles apparaissent. Il permet également de définir les liens entre documents ou portions de documents (ex. citation). Les modèles documentaires sont généralement exploités en recherche d’information pour la représentation des documents et des requêtes et il...
متن کاملExploitation des connaissances d'UMLS pour la recherche d'information médicale. Vers un modèle bayésien d'indexation
RÉSUMÉ. La recherche d’information à base de connaissances est largement étudiée, mais avec peu de succès. Dans cet article, nous étudions l’impact de l’exploration d’une base de connaissance, nommée méta thésaurus UMLS pour la recherche d’information médicale. D’abord, l’indexation par concepts d’UMLS extrait dans des textes ne montre qu’une légère amélioration de MAP(Mean Average Precision) p...
متن کاملTraitement d'attributs inter-dépendants pour la recherche d'information par treillis
HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt età la diffusion de documents scientifiques de niveau r...
متن کامل